Apache Doris:从诞生到云原生时代的演进、技术亮点与未来展望

Apache Doris 是由百度自研并开源的一款 MPP(大规模并行处理技术)的分析型数据库产品,其项目已于 2022 年 6 月正式从 Apache 孵化器“毕业”,成为 Apache 顶级项目。

Apache Doris 系列:Bucket(分桶)数量设置建议

Apache Doris集群上线运行一段时间后,随着越来越多的数据增长,集群每次重启后一周左右,读写就会开始变得越来越慢,直到无法正常进行读写。注:表的数据量可以通过 SHOW DATA。命令查看,结果除以副本数,即表的数据量。

大数据Doris(四十):Routine Load基本原理和语法介绍

采样窗口内,允许的最大错误行数。整型,用于设置发送批处理数据的并行度,如果并行度的值超过 BE 配置中的 max_send_batch_parallelism_per_job,那么作为协调点的 BE 将使用 max_send_batch_parallelism_per_job 的值。11、load_

大数据Doris(五十二):Doris数据导出案例和注意事项

与导出到HDFS不同的是导入到本地的目录需要预先创建出来,然后执行导出数据命令即可,这里说的本地是指BE节点,指定对应导出命令时不一定是在哪个BE节点进行导出,所以这里我们在所有BE节点创建导出路径。这里同样对Doris表"export_tbl"进行导出,这里将表中数据导出到BE节点的"/home/

大数据Doris(二十六):Broker Load基本原理和语法介绍

使用Broker Load导入数据时,用户在提交导入任务后,FE 会生成对应的 Plan 并根据目前 BE 的个数和文件的大小,将 Plan 分给 多个 BE 执行,每个 BE 执行一部分导入数据。MERGE 和 DELETE 类型仅适用于 Unique Key 模型表,其中 MERGE 类型需要配

大数据Doris(四十二):Routine Load导入Kafka数据到Doris

以上可以看到state为running,代表当前Routine Load任务正常。如果任务异常可以通过"stop routine load for example_db.test1;"命令将任务停止后,重新再创建。创建Routine Load 将Kafka中的数据加载到Doris routine_l

大数据Doris(二十四):Doris数据Insert Into导入方式介绍

目前 Insert Into 并不支持自定义导入的 timeout 时间,所有 Insert Into 导入的超时时间是统一的,默认的 timeout 时间为1小时。假设有36G数据需要导入到Doris,Doris集群数据导入速度为10M/s(最大限速为10M/s,可以根据先前导入的数据量/消耗秒计

大数据Doris(二十一):Bloom Filter索引以及Doris索引总结

Doris BloomFilter索引的创建是通过在建表语句的PROPERTIES里加上"bloom_filter_columns"="k1,k2,k3",这个属性,k1,k2,k3是你要创建的BloomFilter索引的Key列名称,例如下面我们对表里的saler_id,category_id创建

大数据Doris(二):Apache Doris 部署介绍

在部署Apache Doris时,从1.2.0版本往后,需要在部署BE的节点上调大单个JVM进程的虚拟机内存区域数量值以支撑更多的线程,BE 启动脚本会通过/proc/sys/vm/max_map_count 检查数值是否大于200W,否则启动失败。这里说的"文件"并非我们通常理解的文件,在Linu

大数据Doris(九):Apache Doris 简单使用

Doris集群内置root用户,密码默认为空,root 用户默认拥有集群所有权限,例如:权限变更权限(Grant_priv )、节点变更权限(Node_priv ,包括 FE、BE、BROKER 节点的添加、删除、下线等操作)。创建用户完成后,下次登录Doris就可以使用新用户登录:"mysql -

Apache Doris 系列: 基础篇-Flink SQL写入Doris

本文介绍 Flink SQL如何流式写入 Apache Doris

基于Apache Doris数仓平台架构设计

Apache Doris数仓平台架构设计

Doris系列1-Doris介绍

文章目录一. Doris简介二. Doris 整体架构2.1 Doris 整体架构简介2.2 Doris 数据分布2.3 Doris 的使用方式三. Doris关键技术3.1 数据可靠性3.2 易运维3.3 MySQL 兼容性3.4 支持 MPP四. Doris 数据模型4.1 Doris 数据模型

大数据Doris(一):深入了解Apache Doris

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈